点击上方“图灵人工智能”,选择“星标”公众号
您想知道的人工智能干货,第一时间送达
深度学习三巨头之一的Yoshua Bengio也点头称赞。编译 | AI 科技评论组
编辑 | 陈彩娴
5月下旬,国际顶刊《美国国家科学院院刊》(PNAS)发表了一篇其于去年10月接收审核的工作,研究非常扎实:受图灵的计算模型图灵机(TM)与有意识的全局工作空间理论(GWT)影响,作者等人从理论计算机的角度出发,结合计算复杂性理论与机器学习知识,提出了一个形式化的理论计算机模型,将其命名为「有意识的图灵机」(Conscious Turing Machine,CTM),有助于帮助我们进一步理解「意识」。
论文链接:https://www.pnas.org/doi/epdf/10.1073/pnas.2115934119例如,作者团队提到一个观点:计算需要时间。从这个角度看,理论计算机的观点可以改变我们对「自由意志」的定义,即:自由意志是计算不同行动路线的后果的自由,或在可用资源(时间、空间、计算能力和信息)范围内尽可能多地计算这些后果,并从中选题最适合自己目标的行动路线。作者的观点是:无论计算系统是由血肉组成的,还是由金属和硅组成的,意识都是所有合理组织的计算系统属性。从这点出发,CTM不是为大脑建模,也不是暗示意识的神经关联,而是一个简单抽象的意识计算模型,试图理解意识及其相关现象。论文篇幅较长,AI科技评论作了精简的要点整理如下:艾伦·图灵的开创性论文“On computable numbers, with an application to the Entscheidungsproblem”可以说是理论计算机的起源。这篇论文给出了“计算机器”的数学定义,这个机器现在被称为图灵机(TM)。在图灵的定义中,这个计算机器可以计算任何计算机或超级计算机可以计算的函数。定理是数学理论存在的理由,图灵证明了所谓的理论计算机的第一个定理,即停机问题的不可解性。用现代的说法,这个定理证明不可能有通用的(调试)程序能确定哪些计算机程序会停止,哪些不会停止,想要构造一个这样的程序也是不可能的。停机问题的不可解性等同于初等数论的不可判定性,并隐含了哥德尔的第一个不完备定理的弱形式。在哥德尔和图灵之后,数理逻辑学家们开始对哪些问题是可解决的、哪些是不可解决的进行分类,并开始研究不可解决问题的深奥层次。随着计算机器在1960年代的出现并变得广泛可用,我们很快地了解到,许多在原则上可以解决的重要问题实际上不可能得到解决,甚至用最快的电脑也不可能解决,这不是一个技术的问题,而是更深层次的问题。理论计算机新兴领域的研究人员(特别是Jack Edmonds, Stephen Cook, Richard Karp和Leonid Levin)意识到,在自然有限(因此是可解的)问题中,似乎存在一种可解的问题和不可解的问题之间的二分类,反映了之前可解和不可解的二分法。有可行的方法解决的问题在数学上可以形式化为在多项式时间P内通过某些计算机程序可解。此外,实现在多项式时间内可解的问题和在多项式时间NP内可检查的问题可能不是等价的。事实上,如果能确定等价性,就能回答著名的百万美元P=?NP问题。除了定义串行快(多时间)计算复杂度类的层次结构外,理论计算机还定义了并行超快(多时间)计算复杂度类的层次结构。这两个层次结构都提供了模型中使用的定义和选择。对简单与困难、快速与缓慢之间的二分法的理解及含义,以丰富的理论、思想的重构、新颖的概念和惊人的应用,掀起了一场复杂性革命。事实上,在过去的40年里,计算复杂性的发展已经展示了如何利用困难来处理看似不可能的问题。我们用计算机生成的随机序列来说明,这个序列我们称为「伪随机序列」。从表面上看,伪随机序列的概念是如此的不和谐,以至于冯·诺伊曼开玩笑说:“一个考虑用算术方法产生随机数字的人,当然是有罪的。”更准确地说,伪随机序列生成器是一种可行的(多项式时间)计算机程序,用于生成无法与任何可行计算机程序所生成的真正随机序列(比如由独立投掷一枚公平的硬币产生的序列)区分开来的序列。因此,在人类生活的多项式时间世界里,伪随机序列实际上是真正随机的。如果没有理论计算机对多项式和超多项式复杂性之间区别的说明,这种理解是不可能做到的。上述思想的一个应用是用提供(短)随机种子的伪随机发生器产生的序列来取代概率型CTM中的随机序列。特别是,如果概率型CTM具有“自由意志”,那么确定型的CTM也具有“自由意志”。这种确定型的CTM的自由意志与某些(也许是大部分)决定论的思想是相悖的。CTM的定义采用了理论计算机的视角。CTM是一种简单的机器,它在数学上形成(并通过动力学进行修正)有意识的GWT,有意识的GWT概念起源于认知神经科学家Bernard Baars,并由Dehaene和Mashour等人在他们的全局神经元工作空间理论(GNWT)中加以扩展。在《Theater of Consciousness》中,Baars将意识比喻为戏剧演员在工作记忆的舞台上的表演,他们的表演是在一群坐在黑暗中的观众(或者说是无意识处理器)的观察下进行的。在CTM中,GWT的舞台以在任何时刻都包含着CTM意识内容的短时存储器(short-term memory ,STM)为代表。观众则由强大的处理器(processor)代表,每个处理器都有自己的专业知识,这些处理器组成了CTM的长期存储器(long-term memory ,LTM)。这些LTM处理器进行预测,并从CTM的世界获得反馈。每个处理器内部的学习算法会基于这个反馈改进处理器的行为。每个LTM处理器都有自己的专长,并且之间相互竞争,以便在舞台上以块(chunk)的形式获得它们的问题、回答和信息,然后立即把这些内容传递给观众。自觉意识(Conscious awareness),有时也被称为注意力,在CTM中被正式定义为LTM处理器对CTM有意识内容广播的接收。随着时间的推移,一些处理器通过链接(links)连接起来,这些LTM处理器之间从通过STM的有意识通信变成通过链接的无意识通信。通过链接对块进行传播,可以强化其自觉意识,这一过程被Dehaene和Changeux称为点火(ignition)。受到Baars的GWT架构的启发,CTM还集成了一些对意识感至关重要的附加功能。其中包括其动态,其丰富的多模态内部语言(我们称之为脑语(Brainish)),以及特殊的LTM处理器,使CTM能够创建世界的模型。有限资源的后果在我们对与意识相关的现象(如变化盲视和自由意志)的高层次解释中发挥着至关重要的作用。- 块的正式定义:块是每个LTM处理器在时钟每一次滴答声中投入到意识竞争中的信息;
- 每个处理器中的机器学习算法,这个算法利用来自全球广播、其他处理器和外部世界的反馈来提升处理器的竞争力和可靠性。
尽管受到图灵的计算机模型的启发,但CTM并不是标准的图灵机。这是因为赋予CTM“意识感”的不是它的计算能力,也不是它的输入-输出映射,而是它的全局工作空间架构、预测动力学(预测、反馈和学习的循环)、其丰富的多模态内部语言,以及某些特殊的LTM处理器,如世界模型处理器。如前所述,我们不是在寻找大脑的模型,而是在寻找意识的简单模型。假设CTM有一个有限的生命周期t。时间是用离散的时钟节拍测量的,t= 0,1,2,…T∼10 ^ 10。(大约每秒10次,即阿尔法脑波节奏)。CTM诞生于时间0。CTM是一个七元组,包括<STM, LTM, Up Tree, Down Tree, Links, Input, Output>等组件。在CTM中,STM是一种能够保存单个块的小内存,定义见2.2节。LTM是N个处理器(N>10^7)的大规模集合,每个处理器是一个随机访问机器,其随机访问内存大到足以容纳T个块的一小倍。处理器只在LTM中,而不是在STM中,所以当文中说到处理器时,所指的是LTM处理器。某些特殊的LTM处理器特别负责CTM的意识感觉。这些特别的处理器包括世界处理器的模型、内部语音处理器和用于处理内部视觉、内部触觉等的其他内部通用语音处理器。下行树( Down Tree)是一棵高度为1的简单下向树,STM中有一个根,有N条从根指向叶的边,每个LTM处理器中有一个叶。上行树是一个向上的二叉树,高度为h,有N个叶子,每个LTM处理器有一个叶子,STM中有一个(单个)根。每个LTM处理器都有自己的专长,通过上行树竞争把属于自己的问题、答案和信息获取到STM,并通过下行树立即广播给所有LTM处理器的观众。为了让CTM简单运行,所有LTM处理器向STM的竞争提交信息,所有处理器接收来自STM的所有广播。然而在人类身上,视觉的背侧通路从来没有意识(从来没有达到STM),只有腹侧通路是有意识的。这种自下而上/自上而下的循环类似于全局神经元工作空间(global neuronal workspace,GNW)假说,即“有意识的访问在两个连续的阶段进行……在第一个阶段,从约100毫秒到约300毫秒,刺激以一种自下而上、无意识的方式在处理器的皮层层次上上升;在第二阶段,如果刺激被认为满足当前的目标和注意力状态,就会以自上而下的方式被放大,并由一小部分GNW神经元的持续活动维持,其余的则被抑制。整个工作空间是全局连接的,在任何给定的时间,只有一个这样的意识表征是活跃的。”2.1.3. 块,有意识的内容,自觉意识,和意识流
问题、答案和信息以块的形式传递。在上行树竞争中胜出进入STM的块被称为CTM的有意识内容。在CTM中,与Baars的剧场比喻不同,STM(舞台)中总是有一个完全相同的演员。在每一个及时的步骤中,演员都会得到一个胜出的块,这个块就是通过下行树即时播放的脚本。我们认为,当所有LTM处理器通过这个广播接收到这些内容时,CTM就会有意识地意识到这些内容。我们将自觉意识定义为所有LTM处理器对STM广播的接收,而不是在STM中出现获胜块,这么定义是为了强调意识的感觉是出现在处理器之后,尤其是世界模型和内部语音模型接收到广播后产生的。在CTM中,我们对意识的定义大致与认知神经学家所说的“注意力”一致。我们在CTM中所称的意识感觉(the feeling of consciousness)大致与认知神经学家所说的“意识”或“主观意识”一致。CTM中不断冒泡的块竞争着STM,其中的获胜块会不断地从STM被广播到LTM处理器中。从STM传播到LTM的时间有序块形成了一个意识流。如第3节所述,这种流是意识的主观感觉的一部分。处理器之间的所有沟通最初都是通过STM进行的。例如,处理器A可以向上行树竞争向STM提交问题。如果这个问题在竞争中胜出,就会被广播到所有LTM处理器。然后处理器B可以通过竞争提交答案,如果处理器B赢了,就会被广播,以此类推。如果A认为B的答案是足够有用的,那么A和B之间就会形成双向联系。这种联系让人想起Hebbian原理,即“一起放电的神经元会连接在一起”。除了向上行树竞争发送块,处理器还通过链接发送块。这样,A和B之间(通过STM的)有意识交流就可以通过A和B之间(通过链接)发送的块,变成直接的无意识交流。A和B之间形成了额外的链接,用我们的话来说就是A和B之间的链接加强了。链接是处理器之间传输信息的通道。随着CTM有意识内容的广播,那些在链接处理器之间发送的块可以加强和维持自觉意识。这种强化与Dehaene和Changeux在他们的GNWT中所称的“全局点火”有关。正如Dehaene所写的那样,“全局点火出现在……当广播超过某个阈值,并进行了自我强化,一些神经元刺激其他神经元,然后这种刺激又反过来回传兴奋的时候。连接在一起的(细胞)突然进入一种自我维持的高水平活动状态,正如Hebb所说的,这是一种回响的‘细胞集合(Cell assembly))’。”CTM的环境(Env)是Rm(t)的一个子集,其中R表示实数,m是正整数维度,t(非负整数)是时间。输入映射将CTM的传感器获取的、时变的环境信息发送给指定的LTM处理器(为了简单起见,这里假设这些传感器是输入映射的一部分),后者将环境信息转换为块。输出映射将命令信息从LTM处理器传递到执行器(这里假定执行器是输出映射的一部分),来对环境进行操作。在CTM中,一共有五种连接为信息传输提供路径和机制。下图显示了CTM与LTM处理器之间的这五种连接,它们分别是:- Env-LTM:来自环境的定向边通过传感器与感觉数据的处理器之间的连接;
- LTM—Env:特定处理器通过执行器将定向边传递给环境,执行器作用于环境(特定处理器指的是比如生成手指运动指令的处理器,执行器如接收这些处理器指令的手指,执行器通过这些处理器的手指动作对环境进行操作)。
2.2. 脑语(CTM的多模型内部语言),要点和块
脑语(Brainish)是CTM的内部语言,用于处理器之间的通信,通过竞争和广播或直接通过链接来实现通信。另一方面,处理器内部使用的语言通常因处理器而异,除了脑语还有其他语言。脑语是用来表达内部语言、内部视觉、内部感觉、想象和梦境的语言。脑语包括输入和输出的编码表示,这些编码表示都是用简洁的多模态脑语单词和短语来表示,称为“gists”(要点)。要点可以包含一个场景的本质,或关于一个证明的高度可扩展的思想。要点还可以是一个问题的答案,某种洞察,一个梦的图像,一种痛苦(的描述),等等。比起外部语言如英语、汉语或狗语(Doggish),脑语能够更好地表达和操控图像、声音、触觉和思想——包括非符号化的思想。作者认为,具有表现力的内在语言是意识感觉的重要组成部分(详见第3节)。信息在所有边上以块的形式进行传输,其在处理器之间传输,在STM和LTM之间传输,从输入到LTM之间传输,也从LTM到输出之间传输。一个块就是一个六元组:<address, t, gist, weight, intensity, mood> 。其中,address(地址)是LTM处理器产生的地址块,t是块产生的时间,gist(要点)是脑语中被“简明表示”的信息,该信息是处理器计划所要通信的内容。weight(权重)是处理器提供给要点的一个假数,intensity(强度)和mood(情绪)在时间t分别以 |weight|和weight开始。研究者注意到,块的大小(以及它的组件的大小,包括要点)必然会受到计算复杂性考虑的限制。2.3. 概率性质的上行树竞争:coin-flip神经元和竞争函数
上行树竞争是决定哪个LTM处理器能够将自己的块放入STM的机制。在每个计时点t= 0,1,…,T,第t个竞争开始时,每个处理器p将其块放入上行树的处理器叶节点中。在一个块被送入上行树竞争之后,当它在竞争树上向上移动时,它的address、t、gist和weight保持不变,但其ntensity和mood会发生变化,以纳入更多的全局信息。对于t>0和s>0,更新上行树竞争中节点vs处的块,所需的计算包括:1) 两次快速计算f,对其值进行求和和除法运算,以及一次快速的概率选择;3) 对与vs的子节点相关的块的强度和情绪进行求和,并将这些总和设置为块在vs节点处的强度和情绪。这些计算都必须在1个时间单位内完成,这对节点上块的大小和可以在该节点执行的计算量设置了一个界限。我们假设每个处理器p在其内部内存中存储元组的序列,这些序列按时间t排序,包括处理器送到竞争中的块p、t、0,和处理器通过STM的广播所接收到的块,以及处理器在时间t从链接或输入映射中接收到的块的选择子集。这些序列是CTM存储的重要组成部分。「历史」提供了一个p所看到和做过的高层存储。高层存储在很大程度上解释了CTM在意识感受中的自我感知。CTM需要高层存储结合预测算法来创造梦(详见第4.5节)。这些存储的信息可能会定期被修剪,因此只剩下「显著」的块,最显著的是那些代表可怕、美妙或意外事件的块。通常而言,每个处理器都会对它生成、修改和存储的块进行预测。2.6. 预测动力学=预测+反馈+学习(睡眠专家算法)(Sleeping Experts Algorithm,SEAs)
处理器需要反馈来评估其预测的正确性和检测错误,并学习如何提高正确性和减少并纠正错误。•无论是提交给STM竞争、通过链接提交给其他处理器,还是提交给影响环境的执行器,LTM处理器都会对所有块进行CTM预测。•反馈从STM广播中接收的块、通过链接接收的块以及通过输入映射从环境接收的块。在CTM中,预测、反馈和学习不断循环。CTM需要警惕任何不寻常的事情和任何形式的意外,以便在必要时处理这些事情,并始终提高对世界的理解。通过这种循环,预测的误差(例如「意外」)被最小化。处理器尤其需要知道自己在设置权重时是过于保守还是过于大胆,这样才能修正权重分配算法。睡眠专家算法(SEAs)是LTM处理器用来实现这一目标的一类学习算法。这里所展示的是SEAs最简单的版本之一。当出现以下情况时,鼓动处理器(提高其赋给块的强度):- 它的信息(在SEA看来)比进入STM的信息更有价值。
当出现以下情况时,抑制处理器(降低其赋给块的强度):- 它的信息被发现(可能是之后被发现)不如某些未能进入STM的块的信息有价值。
SEAs在处理器是否将它们的块放入STM方面起作用。SEAs也对处理器是否会「注意」那些通过链接发送给它们的块中的要点有影响。块的权重绝对值显示生成块的处理器认为其要点是否重要,这将影响接收块的处理器是否会注意到它。研究者比较了CTM和Baars的GWT模型,见下图。
图注:模型草图:Baars的GWT模型(左)和CTM模型(右)为了简单起见,此图简化了许多功能。例如,CTM在舞台上只有一个「演员」,这个「演员」一次只持有一个块。此外,CTM中的所有处理器都在LTM中。在这里,中央执行器被取消,因为其功能可以由处理器代劳。在CTM中,输入和输出直接进出LTM处理器,而不是直接通过STM。在CTM中,块在定义明确的竞争中展开竞赛,以登上舞台(STM)。自觉意识(注意力)是所有LTM处理器对所广播的获胜块(即CTM的意识内容)的接收,而不是发生在输入和STM之间的事件。Baddeley和Hitch的口头排练和视觉空间画板的角色由LTM处理器承担。预测动力学(预测、反馈和学习的循环)和多模态内部语言(脑语)以及计算和复杂性考虑是显著的、关键的CTM特性。最后,正如「扩展心智理论」所述,CTM可以LTM处理器的形式访问现有技术,如Google、Wikipedia、WolframAlpha、AlphaGo等,LTM处理器的任务就是去使用这些应用程序。这是确保CTM在其生命周期开始时(t=0)拥有大量功能强大的处理器集合的一种方法,该集合在其整个生命周期中都是可扩充的。CTM模型及其动力学的关键特征与Dennett概述的意识特性之间具有异曲同工之处:控制我们意识思维的转变的既不是主调度器,也不是Boss神经元,更不是Homunculus或Res Cogitans。在实施控制的必定是一个动态的、有些竞争性的过程。究竟是什么决定了谁是赢家?应当是类似于伴随和控制着所有内容命运的微观情绪、积极和消极的配价强度这些因素,不仅是在情感上明显突出的事件如痛苦、尴尬或欲望的强迫性记忆,而且还有最深奥和抽象的理论思考。尽管受到了Baars的GWT架构的启发,但CTM集成了其意识感受所必需的功能。这是下一节的重点。虽然根据STM传播的意识内容的定义,CTM是有意识的,但这个定义并没有解释在CTM中是什么产生了意识的感觉。作者认为,CTM对意识的感觉主要是其极富表现力的脑语所带来的,再加上CTM的架构、特定的特殊处理器和CTM的预测动态(预测、反馈和学习)。多模态脑语准确地描述了CTM所感知到的世界。这种知觉是由多模态语言的感觉所组成的。它的词汇包括气(鼻孔闻到的气味)、疼痛(极度不愉快的疼痛感觉)、脸(看别人脸时看到的东西)等等。梦是很重要的,因为它显示了当CTM既没有输入也没有输出时,要点可以表达什么。这包括获得STM访问权的上行树竞争,以及随后对赢家所进行的全局的下行树广播,尤其是所有在产生意识感觉中扮演特殊角色的处理器。- 世界模型处理器(Model of The World processor)根据从环境中获得的信息,或从可能被修改过的内部存储器中获得的信息,来构建CTM世界的模型。将CTM的内部世界定义为世界处理器的模型为CTM创建的稀疏「CTM」模型。将CTM的外部世界定义为它用脑语所注释的标签和描述,包括它们(可能)拥有的感觉和它们(可能)执行的动作。
- 内部语音处理器提取STM广播的要点中被编码的任何语音,并将其发送到与输入映射发送外部语音的要点(由输入映射创建的要点)相同的位置。这最初是通过STM发送的,然后在链接形成后,直接通过链接发送。「内部语音」是由内部语音处理器产生的,它使CTM能够回忆过去,预测未来,并制定计划。内在语言的要点(如自言自语或梦中所说的和所听到的)与外在语言的要点几乎没有区别。人类的内部语言听起来很像外部语言,以至于很难区分二者,就像精神分裂症患者的情况一样。
- 内部视觉和内部(触觉)感觉处理器,将STM广播的任何图像和感觉都映射到输入映射发送到外部场景和外部感觉的任何位置。内部视觉和外部视觉(由输入图像产生的视觉要点)几乎没有区别。CTM的记忆和预测能力使得CTM能够创造内部图像和感觉,从而产生想象和梦境。为了阻止精神分裂症的幻觉,人类大脑会区分内部图像和外部图像。大脑有各种各样的技巧来做到这一点,其中一个就是让梦变得难以记忆。
这些处理器通知CTM世界模型中的「眼睛」和「皮肤」,让它们「看到」CTM从视觉记忆中回忆起来的任何东西,并「有触觉地感知」CTM从感官记忆中回忆起的任何东西。这些眼睛和皮肤就是CTM的心灵之眼和心灵之肤。作者认为,这些处理器是内部通用的语音处理器。此外,作者认为,CTM通过预测、反馈和学习的持续循环影响了CTM对意识的感觉。在CTM的世界处理器模型中,这种感觉通过(并行的)预测动力学进一步增强,在该模型中,CTM不断地进行规划和测试。正反馈给CTM一个信号,表明它了解正在发生的事情;负反馈——除非是关于一些无法预测的事情,比如一声意外的巨响——给CTM提供了它不知道或不理解的事情的证据。现在回到世界处理器的模型,来描述一个中心任务,即将其模型的各个组成部分标记为self(自我)或非self,或者未知。世界处理器的模型如何决定什么是self,什么不是self?如果在对一个块(CTM的一个思想)的广播之后,执行器立即在环境中执行一个动作——这个思想会导致相同的动作持续不断地重复——那么这表明执行器是self的一部分。世界模型的处理器还有其他重要的工作来赋予CTM以自我意识,包括创造想象、创造环境的映射和表达运动的环境,帮助计划环境中的行为,帮助预测环境中的自我和而非自我的行为,纠正对自我和非自我行为的预测。当CTM通过广播发现自己在思考自己的意识时,世界模型处理器就会将模型中的「CTM」标记为「有意识的」。现在再来看看,为什么CTM会认为自己是有意识的。这不可能是因为世界模型处理器或任何其他处理器认为它是有意识的,因为处理器只是运行算法的机器——而且这样的机器并没有感觉。作者认为,CTM作为一个整体是有意识的,这有一部分是因为世界模型处理器会将其世界模型中的「CTM」视为有意识的,并将这个观点传播给所有的处理器。在这里,「CTM」是对更复杂的CTM的简单学习表示。这一节将探讨CTM如何可能经历一般与意识相关的各种现象。作者相信从模型中得出的解释,提供了对意识体验如何产生或者可能如何产生的高层次理解,这些解释与心理学和神经科学文献达成了高度一致。在下文的例子中,盲视说明了有意识和无意识意识之间的区别。在盲视中,人不会有意识地看到外部世界。当被要求在一个杂乱的房间里拿东西时,实验参与者会有一种典型的反应:“我看不到东西在哪儿。”但如果谨慎对待这个要求,实验参与者还是能熟练完成这个任务的。在CTM中,视觉输入直接从视觉传感器到处理视觉输入的LTM处理器的一个子集。然而,在盲视的CTM中,由于某种故障,也许是上行树的断裂,或者是视觉处理器无法有竞争性地输入块的信息,这些信息无法上传到 STM,因此也就无法得到全局广播。由于这个原因,CTM不会有意识地意识到自己能看到。然而,信息仍然可以通过链接在(无意识的)处理器之间进行交流。因此,视觉处理器收到的视觉信息可以通过链接发送到控制腿部执行器的行走处理器。当一个人未能察觉到明明就在眼前的视觉刺激时,就会出现无意盲视。无意盲视是“当注意力集中在其他任务上时,没有注意到一些意外的东西的存在”。例如,在著名的选择性注意测试中,实验者向观众播放影片「看不见的大猩猩」,并要求观众“数出穿白衬衫的球员的传球次数”。几乎所有的观众都给出了接近正确的数字,但当被问及“你看到大猩猩了吗?”时,他们却呆若木鸡。这到底是怎么回事?假设CTM正在观看大猩猩的影片。关于白衬衫球员的输入查询获得了STM的访问权,然后立即广播给所有LTM处理器。为了执行这个任务,CTM的视觉处理器给白衬衫要点分配了高密度(intensity),而给任何黑色的东西分配了非常低的密度,因此有“大猩猩”图案的块状物要点很少有机会进入STM。CTM并没有有意识地看到这个大猩猩。CTM对无意盲视的解释是:对要点给予不同的密度,对不相关的要点给予较低的密度,那么得到较高密度的块会有更大的竞争优势。根据参考文献中进行的模拟,在某些“点燃”状态下,“自发活动可以阻止外部感觉处理”。他们把这种阻断与无意盲视的原因联系起来。在我们看来,阻断人脑对黑色物体的“感觉处理”,大致相当于CTM大幅降低了块中黑色要点的密度,从而降低了这些块进入STM的机会。CTM中不同密度的影响也符合理论上的含义,即人类的无意盲视“可以作为不相关信息的过滤器,可能过滤掉意外事件”。当人不能注意到图片或场景中的巨大变化时,就会出现变化盲视,它是“未能注意到某些东西从一个时刻到另一个时刻的变化”。一个颇具启发性的例子是侦探视频。一名侦探进入了谋杀现场,并说“显然,这个房间里有人谋杀了斯迈思爵士”,并立即依次审问每个嫌疑人。女仆称:“我在主卧室里擦拭铜器。”管家说:“我在给老爷的烤饼涂黄油。”而斯迈思夫人说:“我在盆景棚里种牵牛花。”这些信息足以让聪明的侦探当场破解谋杀案。然而,为什么我们没有注意到开头的屏幕截图和结尾之间有许多不协调的场景变形?从CTM的角度来看,在观看“侦探”视频时,CTM有形成整体的印象,但没有注意到风衣、花、画等被其他东西取代后所发生的变化,这是因为以下原因:1)拍摄过程中,导演巧妙安排了整个场景乃至于单个人物的变化,去除了深色风衣变成白色风衣、熊变成盔甲、擀面杖变成烛台、死者换了衣服并抬起了腿等等变化的过渡。视频输入从未向CTM的视觉处理器发出信号,表明“场景”已被修改。2)重要的是,同样的要点对开头和结尾的场景都有同样的描述:“一座豪宅的客厅,里面有侦探、管家、女仆、其他人,还有一个地板上的死者。”同样,CTM 的解释与关于人类变化盲视的文献一致。鉴于变化检测需要充分表示变化前和变化后的场景以及比较,任何影响表示的丰富性或比较表示的倾向的任务特征都应该影响检测。变化对象的语义重要性似乎对受试者关注并因此注意到变化的可能性有最大影响。4.4 错觉,不注意的盲目性和变化的盲目性可能被认为是幻觉的例子
根据定义,CTM是有意识地意识到从STM广播的块中的要点的。(这些要点从LTM处理器到达STM。LTM处理器是通过输入映射从传感器得到,或者通过链接从其他LTM处理器得到,或者通过广播从STM处得到这些要点的)。要点储存在LTM记忆中的原因很多,其中一个原因是为处理器提供高层次的故事,如梦中发生的故事。在CTM中,意识流是STM播放的要点序列。每个时刻的每个视觉要点都给CTM一种感觉,即它看到了眼前的整个场景,尽管它最多只看到场景的一小部分。整体的错觉有几种解释,其中最主要的是,一个多模态的脑语要点可以描述一个极其复杂的场景,比如“我站在一个包含小溪、小路、小桥和树木的日本风格花园前”。这个要点是否包括了iPhone相机拍摄的1200万像素照片中的细节(就像它感觉我们看到了一样)?整体的幻觉是要点中高度暗示性(简洁)信息的结果。CTM像变魔术一样变出了这个场景。Keith Frankish 称这是意识的幻觉主义理论。梦是最终的幻觉。有些人声称不做梦,但大多数人都是做梦的。梦可能是视觉的、听觉的、触觉的,等等。梦往往与情感过程有关,可以表达巨大的痛苦和恐惧(噩梦)或巨大的快乐(如飞行梦)。一个人可以感觉到腿部的残缺不全的疼痛,醒来后却发现疼痛完全是虚幻的,根本没有疼痛,一个人也可以睡着时脸朝下,醒来时脸朝上。在CTM中,一个内置的睡眠处理器(Sleep processor)跟踪时间、习惯、日/夜等,并有内部算法来监测睡眠的需要。如果睡眠处理器确定需要睡眠,它就会通过提高自己的块的密度,让块能够进入STM,并将其他块阻挡在STM外。这与降低其他LTM处理器的块的密度的效果大致相同。这个处理器还阻止或大大降低各种输入(所看和所听)的密度,并阻止激活输出的信号(如四肢收到的信号)。这就是睡眠状态。睡眠处理器不断监测睡眠的需要,并随着这种需要的减少,按比例减少自己的块的密度。这最终允许梦的要点(以块为单位)达到STM。这就是梦的状态。最后,当睡眠处理器降低其对输入和输出的限制时,CTM就会醒来。在人类中,非快速眼动睡眠和快速眼动睡眠在觉醒前可以交替进行几次。当CTM处于梦境状态时,一个创造梦境的处理器(Dream Creator)便开始活动(也就是说,这个处理器开始将它的块送入STM)。这些块中的要点包含思想的内核(通常基于早期CTM的活动、关注、想象)。当这些块被广播时,所有的处理器,包括那些在意识感觉中起关键作用的处理器,都会收到这些广播并竞相作出反应。这使CTM在梦境中具有与清醒时相同的活着的感觉。造梦处理器和其他处理器轮流来回互动。造梦处理器和处理器之间的对话——来回的互动——是构成梦想的要点序列、这个序列就是梦的意识流。梦实质上是将这一序列的块拼接起来,产生一个梦的意识流(内在电影),1)看到、听到和感觉到梦中的世界,2)影响梦中世界出现的东西。这样一个(互动的)内心电影显示一系列的感觉输入(图像、气味和声音),并产生一系列的行动。当CTM处于睡眠状态但不做梦时,大多数处理器不能将它们的块送入STM,巨大噪音检测器和睡眠处理器本身是例外。睡眠处理器在STM中的块会阻止大多数其他处理器的块到达STM。根据设计,睡眠处理器持有一个空的要点,所以CTM没有意识或几乎没有意识。在CTM离开睡眠状态进入梦境后,一部分LTM处理器,如内视处理器,可以将它们的块送入STM。因此,在做梦时,CTM是有意识的,可以生动地体验事件。正如第3节所讨论的,关键的处理器,如内在言语、内在视觉、内在感觉和世界模型的处理器,在产生CTM的意识感觉方面起着特殊作用。当CTM做梦时,这些处理器也发挥类似的作用。- 内在语音处理器从STM广播的多模态图形中提取内在语音,并将该语音发送到接收外部语音的同一处理器。这个过程使梦中的语言听起来像外部语言。内在视觉和内在感觉处理器以类似的方式帮助创造梦境。
梦境展示了脑语要点的力量。CTM 在梦中看到的、听到的、感觉到的和做的,必然是由能够回忆、修改和向STM的竞争提交创作的处理器编造的。这些编造是现实的,因为它们使用的是清醒时产生的同样的要点。因此,即使 CTM 完全脱离了外部输入,梦也会产生现实世界的感觉。因此,梦可以显得如此逼真,以至于CTM可能变得难以区分梦境和现实(但是人类较难记住梦境,所以这个问题在人类中就可以避免)。已有的文献证明,一个人看到一张脸后,无论是从记忆中找回这张脸,还是当这张脸出现在梦中,都会出现同样的神经活动模式。文献还指出,在快速眼动睡眠中,当人有运动的感觉时,梦中运动皮层的激活与清醒时的激活是一样的。- 世界模型处理器预测CTM的行为将在其(内部和外部)世界中产生的影响。它从这些行动在其世界模型中的效果来做这件事。造梦处理器可以使用这个相同的预测机器来创造梦。
梦也使CTM能够在未知和可能的危险情况下测试自己。在人类和CTM中,梦都可以成为实验各种可能解决方案的实验室。然而,与清醒时的意识不同,由于CTM在其世界模型处理器中的“一致性检查器”没有得到来自环境的输入,不一致的情况在梦中比清醒时更容易发生而不被注意。因此,CTM可以在梦中飞行。Zadra和 Stickgold 断言,在人类中,“梦境并不完全重现记忆。梦创造了一种叙述,其要点与最近的一些记忆相同,并可能有相同的标题。”他们指出,“快速眼动睡眠提供了一种大脑状态,在这种状态下,弱的和意外的联想比正常的强联想更强烈地被激活,这解释了快速眼动睡眠是怎么帮助去寻找一些弱相关的遥远的联想,也许解释了我们快速眼动睡眠期的梦为什么那么奇怪。”自由意志的问题是古老的,早在公元前一世纪就出现在 Lucretius(De Rerum Natura)。“如果所有的运动总是相互联系的,新的产生于旧的,有一个确定的顺序——如果原子从来没有转向从而产生一些新的运动,打破命运的束缚,永恒的因果顺序——那么整个地球上的生物所拥有的自由意志的来源是什么呢?”Samuel Johnson博士在1709年至1784年之间的观察捕捉到了自由意志的悖论:“所有的理论都反对意志的自由,而所有的经验都支持意志的自由。”Stanislas Dehaen 则发出了当代的声音:“我们的大脑状态显然不是无因的,也不能逃脱物理学定律——没有什么可以逃脱。但是,只要我们的决定是基于有意识的思考,自主地进行,没有任何障碍,在承诺采取某项行动之前仔细权衡利弊,就是真正的自由。当这种情况发生时,我们说的自愿决定是正确。当然,即使它最终是由我们的基因和环境造成的。”本文作者在 Dehaene 的基础上补充说,计算需要时间。为了做出决定,CTM在需要时间的评估中对其备选方案进行评估,在这段时间里,CTM是自由的,事实上可以感觉到自由,选择它认为(或者说计算出的)最好的一个结果。因此,理论计算机的观点影响了我们对自由意志的定义。自由意志是计算不同行动路线的后果的自由——或在可用资源(时间、空间、计算能力和信息)范围内尽可能多地计算这些后果——并从中选择最适合自己目标的行动路线。这个定义同时包含了预测性动态(计算不同行动方案的后果)和资源限制(时间、空间、计算能力和信息)。例如,如一个 CTM 被要求在国际象棋游戏中扮演一个特定的位置。不同的处理器建议不同的棋步。CTM的主要下棋处理器(假设存在这样的处理器,或者可以说是一个对游戏有“高层次”看法的处理器)通过在STM中广播一个块来表示,它认识到它有一个可以选择的棋步,并且它认为值得仔细研究每一步的后果。在这一点上,面对可能的棋步选择,但尚未评估这些棋步的后果,CTM可以在时间限制内自由选择它认为最好的棋步。1)当考虑到CTM会询问自己 “我应该做什么动作?”的时刻,意味着这个问题已经上升到STM阶段,并通过广播到达LTM处理器端的观众处。作为回应,一些观众会向活动提出自己的建议,而竞争的获胜者则可以登上舞台得到广播。因为要点很短,因此像一些比较简要的广播也可以得到合理地阐明。2)出现在STM并向LTM全局广播的持续性反复的评论、命令、问题、建议和答案,使CTM对其控制有了认知。当CTM被问及它是如何产生一个具体建议的(即,在提出那个建议的过程中它进行了哪些思考),它的处理器将能够阐明达到这个阶段的一部分对话(尽管短期内也许不会超过这个阶段)。3)许多LTM处理器通过竞争来产生CTM的最终决定,但CTM只是有意识地知道进入STM的是什么,而非将所有内容都提交到竞争当中。此外,CTM中绝大部分、即其中大部分的处理器,并不知道处理器间(通过链接)的无意识交谈。就CTM而言, 当有意识地忽视决策出现的过程足够多时,以至于这个决策有时像是凭空得来的。即便如此,尽管CTM无法有意识地知道其建议如何被采纳,除了STM所传播的高层级内容外,它知道建议是来自其内部自身的。对于CTM提出的建议理应得到赞扬(毕竟,它们确实来自CTM内部),并且可以用高层次叙述来解释一些内容,至于无法解释的部分,它可以说“我不知道”或是“我不记得”。正是有了那些经过选择的知识(CTM对选择有了解、也有不理解之处),CTM才生成了自由意识的感觉。不管确定性与否,这种经验上的感觉是自由意志的一种。随机性对于这种自由意志感觉的解释有多重要?要注意的是,在CTM中,上述解释并不需要运用到量子物理学。唯一的随机性是在向上树竞争中的coin-flip神经元,以及处理器在其概率算法中使用的任何随机性。此外,可以证明的是,上述关于自由意志感觉的论证仍然适用于完全确定的CTM(例如,使用伪随机性的CTM)。由此可见(可以预见这将引起一场激烈的争论),即使在一个完全确定的世界中,CTM也会感觉到它有自由意志。
往期精彩必读文章(单击就可查看):
1.看了 72 位图灵奖得主成就,才发现我对计算机一无所知
2.谦恭的程序员——图灵奖得主迪杰斯特拉,每位程序员都该读一读,包含最初的程序员的职业感受,以及一些语言和软件历史的认识
3.2021年图灵奖公布!72岁的美国科学家 Jack Dongarra 获奖
4.图灵奖得主Yann LeCun:未来几十年AI研究的最大挑战是「预测世界模型」
5.图灵奖得主、《龙书》作者万字长文讲解:什么是「抽象」?
6.浙江大学吴飞教授、陈为教授:人工智能的诞生、人才培养体系、人才培养构成元素及教学知识点的演变
7.周志华教授:“数据、算法、算力” 人工智能三要素,在未来要加上“知识”!
8.吴恩达:机器学习的六个核心算法